介紹過了 NumPy,這次我們來說說 Pandas。Pandas 是一個功能強大的資料處理和分析工具,特別適合處理結構化數據。你可以把它想像成 Python 版本的 Excel,不僅能夠處理數據,還可以進行各種複雜的操作和分析。我們一樣先套用函式庫:import pandas as pd
我們一樣簡寫為 pd,之後就不用完整打出 pandas 從而呼叫它。
接下來先來介紹 Pandas 兩個重要的資料結構 Series 和 DataFrame,這次我們先說說 Series。
Series 類似於一維陣列或列表,但具有更強大的功能。每個 Series 包含一組數據及與之對應的索引。
創建 Series
透過列表創建
series1 = pd.Series([1, 2, 3, 4, 5])
print(series1)
透過字典創建
data = {'a': 1, 'b': 2, 'c': 3}
series2 = pd.Series(data)
print(series2)
透過 NumPy 陣列創建
import numpy as np
series3 = pd.Series(np.array([1, 2, 3, 4, 5]))
print(series3)
這時候輸出出來的左邊是資料的索引,右邊是你的資料。
若是用字典創建的話,左邊會是你的鍵,右邊是你的值。
Series 一樣可以用索引來獲取元素。
使用索引獲取元素
print(series1[0]) # 訪問第一個元素
print(series2['b']) # 訪問標籤為 'b' 的元素
切片print(series1[1:4]) # 取得索引 1 到 3 的元素